语言模型偏见已成为NLP社区的重要研究领域。提出了许多偏见技术,但偏见消融仍然是一个未解决的问题。我们展示了一个新颖的框架,用于通过运动修剪来检查预训练的基于变压器的语言模型的偏见。给定模型和一个偏见的目标,我们的框架找到了与原始模型相比,偏差少的模型子集。我们通过对模型进行修剪来实现我们的框架,同时将其按照歧义目标进行微调。优化仅是修剪分数 - 参数以及模型的权重,该参数充当门。我们尝试修剪注意力头,这是变形金刚的重要组成部分:我们修剪正方形块,并建立了一种修剪整个头部的新方法。最后,我们使用性别偏见证明了我们的框架的用法,并且根据我们的发现,我们提出了对现有辩论方法的改进。此外,我们重新发现了偏见 - 绩效权衡:模型执行越好,其包含的偏见就越多。
translated by 谷歌翻译
数据增强是自然语言处理(NLP)模型的鲁棒性评估的重要组成部分,以及增强他们培训的数据的多样性。在本文中,我们呈现NL-Cogmenter,这是一种新的参与式Python的自然语言增强框架,它支持创建两个转换(对数据的修改)和过滤器(根据特定功能的数据拆分)。我们描述了框架和初始的117个变换和23个过滤器,用于各种自然语言任务。我们通过使用其几个转换来分析流行自然语言模型的鲁棒性来证明NL-Upmenter的功效。基础架构,Datacards和稳健性分析结果在NL-Augmenter存储库上公开可用(\ url {https://github.com/gem-benchmark/nl-augmenter})。
translated by 谷歌翻译
Insufficient image spatial resolution is a serious limitation in many practical scenarios, especially when acquiring images at a finer scale is infeasible or brings higher costs. This is inherent to remote sensing, including Sentinel-2 satellite images that are available free of charge at a high revisit frequency, but whose spatial resolution is limited to 10 m ground sampling distance. The resolution can be increased with super-resolution algorithms, in particular when performed from multiple images captured at subsequent revisits of a satellite, taking advantage of information fusion that leads to enhanced reconstruction accuracy. One of the obstacles in multi-image super-resolution consists in the scarcity of real-world benchmarks - commonly, simulated data are exploited which do not fully reflect the operating conditions. In this paper, we introduce a new MuS2 benchmark for super-resolving multiple Sentinel-2 images, with WorldView-2 imagery used as the high-resolution reference. Within MuS2, we publish the first end-to-end evaluation procedure for this problem which we expect to help the researchers in advancing the state of the art in multi-image super-resolution.
translated by 谷歌翻译
数据革命对数据驱动的解决方案产生了巨大的需求。这一要求推动了越来越多的易于使用的工具和培训为有抱负的数据科学家提供,从而可以快速地构建预测模型。如今,无需详细的计划和验证即可轻松建造和部署数学破坏武器。这迅速扩大了AI失败的清单,即导致财务损失甚至违反民主价值(例如平等,自由和正义)的部署。围绕模型开发的计划,规则和标准缺乏,导致AI的无政府状态。此问题是在不同名称的情况下报告的,例如验证债务,可重复性危机和缺乏解释性。揭示了在模型开发或数据获取早期阶段犯的错误。因此,我们不再治愈部署有害模型的后果,而是通过将更多注意力提早地关注初始计划阶段来防止它们。在本文中,我们建议一个快速简单的框架来支持AI解决方案的规划。POCA框架基于四个支柱:性能,不透明,后果和假设。它有助于设置期望并计划在建立任何模型和任何模型之前的AI解决方案的约束条件收集了任何数据。借助POCA方法,可以为模型构建过程定义初步要求,以便昂贵的模型错误指定错误可以尽快甚至避免使用OR。 AI研究人员,产品所有者和业务分析师可以在构建AI解决方案的初始阶段使用此框架。
translated by 谷歌翻译
生态系统抵御气候变化的稳定性和能力与其生物多样性直接相关。死树是整体森林健康的关键指标,住房三分之一的森林生态系统生物多样性,占全球碳股的8%。它们被几个自然因素分解,例如,气候,昆虫和真菌。准确的检测和模拟死木群众是了解森林生态,碳循环和分解者至关重要。我们通过在能量最小化框架中将建立的卷积神经网络与新的主动轮廓模型组合,提出一种新的方法来构造从航天照片的死树的精确形状轮廓。我们的方法在检测到的死树联盟的精确度,召回和交叉口方面产生了卓越的性能准确性。这种改进的性能对于满足气候变化(以及系统的其他人为扰动),特别是监测和估算碳股衰减率,监测森林健康和生物多样性以及死木的整体影响从气候变化。
translated by 谷歌翻译
机器学习方法可以检测变量之间的复杂关系,但通常不利用域知识。这是一个限制,因为在许多科学学科(例如系统生物学)中,域知识以图形或网络的形式获得,并且其使用可以改善模型性能。我们需要在许多研究领域中使用广泛且适用的基于网络的算法。在这项工作中,我们使用具有固有的可解释性的新型贪婪决策森林来证明基于多模式节点特征的子网检测。后者将是保留专家并获得对这种算法的信任的关键因素。为了展示一个具体的应用示例,我们专注于生物信息学,系统生物学,尤其是生物医学,但是提出的方法也适用于许多其他领域。系统生物学是统计数据驱动的机器学习能够分析大量多模式生物医学数据的一个很好的例子。这对于达到精密医学的未来目标很重要,在该目标中,患者的复杂性是在系统层面上建模的,以最佳量身定制医疗决策,健康实践和疗法。我们提出的方法可以帮助揭示从多词数据数据的引起疾病的网络模块,以更好地了解诸如癌症之类的复杂疾病。
translated by 谷歌翻译
已经开发了许多方法来了解复杂的预测模型,并将高期望放在事后模型的解释性上。事实证明,这样的解释不是强大的,也不值得信赖,可以被愚弄。本文介绍了用于攻击部分依赖性(图,配置文件,PDP)的技术,这些技术是解释对表格数据训练的任何预测模型的最流行方法。我们展示了可以以对抗性方式操纵PD,这令人震惊,尤其是在可审核性成为支持黑盒机器学习的必备特征的财务或医疗应用中。欺骗是通过中毒数据使用遗传和梯度算法在所需方向弯曲和移动解释的。我们认为,这是使用遗传算法来操纵解释的第一项工作,这是可以转移的,因为它可以概括这两种方式:以模型 - 不合Stic和一种解释 - 不合Snostic的方式。
translated by 谷歌翻译